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(57) Abstract 

The present invention relates to a parallel, universal and 
free-programmable information system enabling the input of all kinds of 
programs, including programs capable of specifying general computing 
operations. The inventive system can also operate the conversion of such 
programs into reduction language expressions and their encoding into a 
DNA sequence. A synthetizer receives the DNA sequence and synthetizes it 
into the corresponding DNA molecule with a specified nucleotide sequence. 
The synthetized DNA molecule is reproduced by an amplification reaction 
using a reproduction device. The information system further encloses a 
reaction facility for implementing simultaneous transformations of DNA 
molecules by biomolecular technologies, according to the reduction rules 
specific to said reduction language, the result-molecule being identified in 
the solution, extracted and possibly reproduced. A sequencing device is 
also provided for determining the result-molecule sequence, said sequence 
being transmitted to the front-end computer which decodes it and provides 
the decoded sequence. 
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(57) Zusammenfassung SSuSSSSBewce 

Das frei programmierbare, universelle Parallel-Rechnersystem zur Durchfuhrung von allgemeinen Berechnungen weist einen eiektro- 
nischen Vorrechner auf, der die Eingabe beliebiger und damit zur Spezifikation allgemeiner Berechnungen fahiger Programme erlaubt, deren 
Umsetzung in Ausdriicke einer Reduktionssprache realisiert und deren Kodierung in eine DNS-Sequenz vornimmt. Eine Synthesevorrich- 
tung empfangt die DNS-Sequenz und synthetisiert sie in ein entsprechendes DNS-Molekul mit einer spezifizierten Nukleotidabfolge. Mittels 
einer Vervielfaltigungsvorrichtung wird das Synthetisierte DNS-Molekul durch eine Amplifikationsreaktion vervielfaltigt. Ferner weist das 
Rechnersystem eine Reaktionsvorrichtung zum gleichzeitigen Ausfuhren von Transformationen der DNS-Molekiile mittels molekularbiol- 
ogischer Techniken gemaB den Reduktionsregeln einer Reduktionssprache auf, wobei das Ergebnismolekiil in der Losung identifiziert, 
extrahiert und ggf. vervielfaltigt wird. AuBerdem ist eine Sequenziervorrichtung zum Bestimmen der Sequenz des Ergebnismolekuls vorge- 
sehen, wobei diese Sequenz an den Vorrechner weitergegeben wird und der Vorrechner die Sequenz dekodiert sowie die dekodierte Sequenz 
ausgibt. ____ 
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Frei proqranuaierbares , universelles 
Parallel - Rechnersvs tern zur Durchf iihrung 
von allcremeinen Berechnungen 

Die Erfindung betrifft ein frei programmierbares , 
universelles Paralle 1 -Rechnersystem zur Durchf iihrung von 
allgemeinen Berechnungen, wobei neben einem elektronischen 
Rechner ein DNS- bzw. DNA-Rechner eingesetzt wird. 

5 

Die Erfindung wird nachstehend anhand der Verwendung eines 
DNA- bzw. DNS -Subsystems beschrieben, ist aber iiber die 
DNA hinaus grundsat z 1 ich bei samtlichen Biopolymeren 
anwendbar. Ganz allgemein ausgedriickt hand-el t es sich bei 

10 einem Biopolymer urn eine durch definierte Methoden aus 

Monomeren polymerisierbare Struktur. Bei den definierten 
Methoden handelt es sich beispielsweise urn enzymatische 
Polymerisation von Nukleotiden, Peptiden oder Zucker- 
einheiten. Das nach der Erfindung vorgesehene Biopolymer- 

15 .Subsystem kann also insbesondere ein DNA- , RNA- oder PNA- 

Subsystem sein. Die Verarbeitung im Biopolymer-Subsystem 
kann auf Peptid- oder Nukleot id-Ebene erfolgen. 



20 Stand der Technik: Biologie und Bio technologie 

Durch die grofien Fortschritte in der modernen Molekular- 
biologie [8] und der molekularen Bio- und Gentechnologie 
sind gewisse Operationen auf DNS -Molekiilen bzw. Ensembles 
von DNS-Molekiilen rout inema£ig , zum Teii mit 
25 automatisierten Apparaten durchf iihrbar geworden. 

Die biologischen Prinzipien der DNS -Replikat ion und Trans- 
kription sind durch die Arbeiten von A. Kornberg. und 
anderen seit den funfziger Jahren mittlerweiie sehr gut 
30 verstanden [18] . Auch die Funkc lonsweise und die Hand - 

habung der entsprechenden Enzyme, die diese Operationen 
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durchf iihren , sind aufgeklart una werden in der Bio- und 
Gentechnoiogie technisch genutzt. 

Zu diesen St andardoperat ionen gehdren : das Schneiden von 
5 DNS-Molekulen an sehr spezifischen durch die Sequenz 

definierten Stellen durch Restrikt ionsenzyme , das 
Verbinden (Ligieren) zweiter solcher Ketten durch das 
Enzym Ligase, das gezielte Einsetzen von DNS-Stiicken an 
definierte Stellen in einem anderen DNS-Molekul 
0 (Klonierung) , das schnelle und vielfache Kopien von DNS- 

Molekulen durch einen automat isierten ProzeB (die sog . PCR 
= Polymerase chain reaction, Polymerasekettenreaktion) , 
die gezielte Generierung (Synthese) von DNS-Molekulen 
vorgegebener Sequenz und ahnliche Operat ionen werden 
5 heutzutage in vielen Labors, aber auch grofetechnisch 

eingesetzt und perf ekt ioniert , z. B. im Rahmen der Genom- 
pro j ekte . 

Da ein Liter einer in solchen Experimenten verwendeten 
0 DNS-Losung (von etwa 6 g DNS pro Liter) ca. 6 * 10 15 

Molekiile mit jeweils ca. 200 Basenpaaren (bp) enthalt, 
entspricht eine solche Losung einer t heoret ischen 
Inf ormat ionsspeicherkapazitat von 3 * 10 5 TeraByte/1. 
Diese Speicherkapaz it at iibertrifft damit heutige 
5 elekt ronische bzw. magnetoopt ische Speicher urn mehr als 

das Mill ionenf ache . 

Bei einem realist ischen Zeitansatz fur eine 
biotechnologische Basisoperation von einer Minute (z. B. 

0 fur eine PCR (- Polymerase chain reaction, Polymerase- 

kettenreaktion) ergeben sich, bei einer simultanen 
Anwendung auf alle Molekiile in einer solchen Losung 
theoretisch etwa 6 * 10 ; '' Operationen pro Minute, d. h. 
etwa 1 Million Tera Operat ionen/sec . Die leistungs- 

(5 fahigsten derzeitigen Supercomputer erreichen kaum 
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Geschwmdigkeiten von Tera Operat ionen/sec bei kaum 1 Tera 
Byte verfiigbarem Speicher. 

Insgesamt schatzt man, da£ die biologischen Operationen 
5 auf DNS gegenuber elektronischen Basisoperat ionen etwa urn 

den Faktor 10 5 energieef f izienter sind, urn den Faktor 10 12 
mehr Speicher erlauben (bei der heute technisch erreich- 
baren Speicherdichte elektronischer und magnetoopt ischer 
Systeme) , und um den Faktor 10 15 mehr Prozessoren 
10 realisierbar machen. 

Wenn man die Leistungsf ahigkeit eines Rechnersyst ems als 
das Produkt der Zahl der Prozessoren und der von jedem 
Prozessor ausfuhrbaren Operationen pro Zeiteinhelt 
15 definiert, ergibt sich bei herkommlichen Rechnern etwa 

100 * 10 10 = 1 Tera Operat ion/ sec , wohingegen bei DNS - 
basierten Systemen ( S t andar d - DNS - Konz ent ra t ion ) 

60 * 10 17 = 6 Millionen Tera Operationen moglich sind. 

20 

Stand der Technik: Informatik 

Die Entwicklung der Informatik hat zwei alternative, 
gleich machtige Berechnungsmodelle hervorgebracht , das 
zustandsorientierte Modell der Turingmaschine [30] und das 
25 funktionale Modell des A-Kalkuls [9,10,11] . Beide Modeile 

sind bis heute intensiv theoretisch untersucht worden 

[2,12,15] , das funktionale vor allem im Zusammenhang mit 
der Verifikation von Programmen [21] und der formaien 

(denotat ionellen) Semantik [13,29] von Programmier- 
30 sprachen. Praktisch basieren jedoch alle heutigen Rechner- 

architekturen auf dem zust andsorient ierten Modell [19] . 
Die elektronische Technologic und Chipentwicklung ist 
j ahrzehntelang auf dieses Modell hin optimiert worden 

[26] . 

35 
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Das alternative Berechnungsmodell des A-Kalkuls basiert 
auf der geordneten Transformation von Ausdrucken 
(Replikation und Substitution) mittels Redukt ionssprachen 
[6 , 7 , 16 , 17 , 33 , 34 , 35] . Obwohl dieses Modell aufgrund seiner 
5 mathematischen Eleganz' und Einfachheit viele praktische 

Vorteile fur die Organisation, Programmierung , Fehlersuche 
und Verifikation bzw . Validierung von Berechnungen gegen- 
uber der Zustandstransf ormat ion aufweist [28,35,36,37] 
(siehe auch DE-C-25 06 454 und DE-C-25 25 795) , konnte es 
10 sich gegenuber der vorherrschenden Technologie, auf die es 

abgebildet werden mu£te, bis jetzt nicht durchsetzen. Dies 
erscheint aus heutiger Sicht auch vers tandl ich , wenn man 
beachtet, wie disparat die heutige Siliz iumtechnoiogie und 
das Berechnungsmodell des A-Kalkuls sind. 

15 

Durch die Arbeiten von Adleman [1] und Lipton [20] sowie 
die PCT-Publikation WO- A- 97/0744 0 ist eine Moglichkeit 
aufgezeigt worden, DNS-Technologie zur Grundlage einer 
neuen Art von Berechnungen zu machen. Sowohl Adleman als 

20 auch Lipton wenden die Technologie auf das zustands- 

orientierte Berechnungsmodell an. Es gibt sogar Arbeiten, 
die explizit darauf zielen", Tur ingmaschinen in DNS 
abzubilden [4,5]. Dies bereitet allerdings erhebliche 
Schwierigkeiten und fiihrt dazu, date bis heute keine 

25 universellen DNS-Rechner konzipiert werden, sondern daS 

vielmehr DNS-Rechner nur fur Spezialauf gaben , etwa in der 
Kryptographie , vorgeschlagen werden. Diese Spezial- 
ausrichtung begrenzt den Einsatz der Rechner und damit die 
Effektivitat der DNS-Technologie. 

30 

Kurze Beschreibung der Erfindung 

Uberraschenderweise ist es moglich, die Vorzuge der 
35 Effizienz biologischer Operationen auf DNS -Nlolekule durch 

Kombination eines DNS-Rechners mit einem elektronischen 
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Vorrechner zu nutzen, bei dem die Umsetzung des Programme 
durch eine Redukt ionssprache , insbesondere nach dem 
A-Kalkul erf olgt , Das Wesen und die Vorteile derart 
organisierter Rechner mit Redukt ionssprachen, also 
funktional organisierten und arbeitenden Rechners ist 
z. B. in [35] beschrieben. 



Nach der Erfindung ist also ein frei programmierbares , 
universelles Parallel -Rechnersystem zur Durchfuhrung von 
10 allgemeinen Berechnungen vorgesehen, das versehen ist mit: 

einem elektronischen Vorrechner, der die Eingabe 
beliebiger und damit zur Spezif ikat ion allgemeiner 
Berechnungen fahiger Programme erlaubt, deren 
Umsetzung in Ausdrucke einer Redukt ionssprache 
15 realisiert und deren Kodierung in eine DNS-Sequenz 

vornimmt , 

einer Synthesevorrichtung, die die kodierte DNS- 
Sequenz von dem Vorrechner empfangt und die die DNS- 
Sequenz in ein entsprechendes DNS-Molekiil mit einer 
20 spezif izierten Nukleot idabf olge synthet isiert , 

einer Vervielf altigungsvorrichtung zum 
Vervielf altigen des synthet isierten DNS-Molekuls 
mittels einer Amplif ikationsreaktion, 

einer Reakt ionsvorr ichtung zum gleichzeit igen 
25 Ausfuhren von Transf ormat ionen der DNS-Molekiile 

mittels molekularbiologischer Techniken gemaS den 
Reduktionsregeln einer Redukt ionssprache , wobei das 
Ergebnismolekiil in der Losung identif iziert , 
extrahiert und ggf . verviel f al t igt wird, und 
30 " einer Sequenziervorrichtung zum Bestxmmen der Sequenz 

des Ergebnismolekuls , 

wobei diese Sequenz an den Vorrechner we i tergegeben 
wird und 

der Vorrechner die Sequenz dekodiert sowie die 
35 dekodierte Sequenz ausgibt . 
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Bei dem erf indungsgemaSen frei programmierbaren, 
universellen Parallel -Rechnersystem handelt es sich urn 
eine Kombination aus einem elektronischen Vorrechner unci 
einem DNS-Subsystem . Der elekt ronische Rechner laSt die 
5 Eingabe beliebiger und damit zur Spezif ikat ion allgemeiner 

Berechnungen fahiger Programme zu, wobei er auf der Basis 
einer funktionalen Programmiersprache, also auf der Basis 
einer Redukt ionssprache arbeitet. Unter einer "Reduktions- 
sprache" versteht man also insbesondere eine funktionale 

10 Programmiersprache, deren Semantik durch bedeutungs- 

erhaltende Transf ormat ionen der Programme definiert sind. 
Als Beispiel fur derartige funktionale Sprachen seien hier 
beispielsweise LISP , Miranda und ML genannt . Ferner wird 
in diesem Zusammenhang auf die Literaturstelle [35] 

15 verwiesen. Eine Implement ierung einer Redukt ionssprache in 

konventioneller Hardware ist beispielsweise in 
DE-C-25 06 454 und DE-C-25 25 795 beschrieben. 

In dem elektronischen Vorrechner des erf indungsgemateen 
20 Parallel -Rechnersystems wird also das Programm in 

Ausdrucke einer Redukt ionssprache umgesetzt so wie deren 
Kodierung in eine DNS-Sequenz vorgenommen. Da Redukt ions - 
sprachen string-orientiert sind, lassen sie sich vorteil- 
haft in eine DNS-Sequenz umsetzen. Die kodierte DNS - 
25 Sequenz ist nun das Eingangssignal fur das DNS-Subsystem, 

das auf einer Synthesevorrichtung , einer Verviel - 
faltigungsvorrichtung, einer Reakt ionsvorr ichtung sowie 
einer Sequenziervorrichtung besteht . Urn mit dem DNS- 
Subsystem parallel arbeiten zu konnen, wird die kodierte 
30 DNS-Sequenz in ein ent sprechenden DNS-Molekul 

synthetisiert und vervielf alt igt . Bei der Vervielf al t igung 
bedient man sich einer Amplif ikat ionsreakt ion , wie 
beispielsweise der PCR bzw. LCR . Mittels molekular- 
biologischer Techniken, wie insbesondere den Insert-, 
35 Delete- und Subs t itute -Operat ionen werden die kopierten 

DNS-Molekule transf ormiert . Bei dieser Transformation wird 
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wiederum von einer Redukt ionssprache Gebrauch gemacht ; die 
Transformation erfolgt also entsprechend den Reduktions- 
regeln dieser Redukt ionssprache - Wenn keine Reduktionen 
mehr moglich sind, liegt das Ergebnismolekul in der aus 
5 den transf ormierten DNS -Mole kill en bestehenden Losung vor . 

Da6 das Ergebnismolekul vorliegt, kann daran erkannt 
werden, da£ die Ausfiihrung weiterer molekularbiologischer 
Prozesse keine Veranderungen der Molekule mit sich bringt, 
die Molekule also nicht mehr klonierc werden konnen . Die 

10 Redukt ionsregeln der Redukt ionssprache werden also, was 

das DNS-Subsystem betrifft, durch den biotechnologischen 
ProzeS in der Reakt ionsvorr ichtung ausgefiihrt. Der Vorteil 
ist, dalS die Transformation der Molekule massiv parallel 
durchgefiihrt werden kann, da die Transf ormationen gleich- 

15 zeitig auf eine Vielzahl von DNS -Mole kul en ausgefiihrt 

werden konnen. 

Durch ebenfalls molekularbiologische Techniken kann das 
gesuchte Ergebnismolekul bzw. allgemein ausgedriickt ein 

20 Molekul in der Losung ident if iziert , extrahiert und ggf . 

vervielf alt igt werden. Sollte man dabei feststellen, daS 
sich auf das Ergebnismolekul noch Redukt ionsoperat ionen 
anwenden lassen, so kann man das Ergebnismolekul nach 
Synthet isierung und Vervielf altigung erneut der Reaktions- 

25 vorrichtung zufuhren, urn weitere Redukt ionsschritte durch- 

zuf iihren . 

Jedes aus der Reakt ionsvorrichtung extrahierte Ergebnis- 
molekul wird einer Sequenziervorrichtung zugefiihrt, die 
30 die Sequenz des Ergebnismolekiils bestimmt. Diese Sequenz 

wird an den Vorrechner we i tergegeben , der die Sequenz 
dekodiert sowie das Ergebnis der Dekodierung anzeigt oder 
ausgibt . 

35 Ais Redukt ionssprache eignet sich insbesondere der 

\-Kalkul (siehe Li t eraturstelle [2]) . Zu insbesondere 
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dieser Reduktionssprache, aber auch allgemein zu 
Redukt ionssprachen ist . weiter hinten unter "Der Aufbau 
eines DNS-Rechners " Naheres ausgef iihrt . Der Vorteil des 
\-Kalkuls besteht in seiner aufierordent lichen Eignung zur 
5 Parallelverarbeitung . Grundsatzlich ist aber die Erfindung 

fur samtliche Redukt ionssprachen anwendbar . 

Das erf indungsgemaSe , frei programmierbare, universelle 
Rechnersystem zur Durchfuhrung von al Igemeinen 

0 Berechnungen zeichnet sich also insbesondere dadurch aus , 

dafe die Berechnungen durch molekularbiologische 
Transformation von DNS -Molekiilen realisiert wird, 
da& die Berechnungen durch Kombinatorausdriicke einer 
Reduktionssprache (z. B . dem X-Kalkul) spezif iziert , 

5 durch entsprechende Nukleot idsequenzen kodiert und 

durch ein dadurch bestimmtes DNS-Molekiil realisiert 
sind, 

da£ die Berechnungen durch spezielle Transf ormationen 
der DNS-Molekiile mittels molekularbiologischer 
0 Techniken gemaS den Redukt ionsregeln des unter- 

liegenden Kalkuls vorgenommen werden, 

date die Reihenfolge der Elementaroperat ionen 
(Redukt ionen) nicht, bzw. nur durch die kausalen 
Datenabhangigkei ten des Programms, festgelegt ist, 
5 wobei die Church-Rosser-Eigenschaf t garantiert, da£ 

das Endergebnis unabhangig von der konkreten 
Ausf uhrungsreihenf olge eindeutig ist , 

da£ die Organisation der Berechnungen durch die 
kausalen Datenabhangigkeiten geregelt wird, 

0 - daS die unabhangige Ausfiihrung von Bas isoperat ionen 

auf mehreren DNS -Molekiilen oder mehreren Abschnitten 
desselben DNS-Molekiils ohne explizite zeitliche 
Synchronisation durchgefiihrt werden kann, 
daS die oben beschr iebenen Eigenschaf ten die 

;5 effizience Nutzung der gro£en Zahl der in einer 

Losung vorhandenen DNS-Molekiile ermoglicht, ohne 
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einen aufwendigen, schwer realisierbaren und das 
Berechnungspotential erheblich reduz ierenden 
Sequent ialisierungsmechanismus in dem DNS-L6sung- 
System etablieren zu mussen, 
5 - daS Berechnungen im Prinzip (bis auf die Daten- 

abhangigkeiten) auf alien DNS-Molekulen in der 
verfugbaren Losung unabhangig (parallel, simultan, 
nebenlaufig) ausgefuhrt werden. 

10 Das erf indungsgemaSe Rechnersys tern besteht aus einem 

herkommlichen elektronischen Vorrechner, einer "Gen- 
maschme" , einem DNS-Rechner wie oben beschrieben und 
einer Sequenziervorr ichtung , wobei 

der Vorrechner eine Programmierumgebung zur Verfugung 

15 stellt, die die Eingabe beliebiger und damit zur 

Spezif ikat ion allgemeiner Berechnungen fahiger 
Programme erlaubt, die Umsetzung in Ausdrucke einer 
Reduktionssprache realisiert, und eine Kodierung in 
eine DNS-Sequenz vornimmt und diese DNS-Sequenz an 

20 eine Synthesevorrichtung weitergibt, 

die Synthesevorrichtung ( "Genmaschine " ) eine 
beliebige DNS-Sequenz in ein ent sprechendes DNS- 
Molekiil mit der spezifischen Nukleot idabf olge 
synthet isiert , 

25 - das synthet isierte Molekiil (das Programm) durch 

beispielsweise eine Amplif ikationsreakt ion wie LCR- 
und/oder PCR-ProzeB geeignet vervielf alt igt wird, 
die so erzeugten DNS-Molekiile zur Ausfuhrung von 
Berechnungen wie oben beschrieben benutzt werden, 

30 - das Ergebnismolekiil in der Losung ident if iziert , 

extrahiert und ggf . vervielf alt igt wird, 
ein SequenzierprozeB z. B. mittels einer 
herkommlichen Sequenziervorrichtung, die Sequenz des 
Ergebnismolekuls bestimmt und die Sequenz an den 

35 Vorrechner wei tergegeben wird, 
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der Vorrechner die berechnete Sequenz dekodiert und 
dem Benutzer das Ergebnis der Berechnung ge- 
eignet prasentiert . 

Eine Realisierung des DNS-Rechnersystem wie oben 

beschrieben sieht insbesondere vor, 

dafe die Reduktionssprachenausdrucke in geschlossene 
X-Ausdriicke, sog. Superkombinatoren , umgesetzt 
werden, 

da£ spezif ische Inkarnat ionen dieser Superkombinator- 
ausdriicke durch eine spezielle PCR- /LCR- Prozedur 
erzeugt werden, so da£ die Variablen der einzeinen 
Superkombinatorinkarnationen eindeutig numeriert und 
damit eindeutig ident if izierbar sind, 

da£ Superkombinatorreduktionen durch molekular- 
biologische Techniken auf den so erzeugten 
Inkarnat ionen ausgefiihrt werden, solange noch 
Reduktionen moglich sind, wobei die Programm- 
applikation ebenfalls eindeutig markiert wird, so dafe 
nach Interaktion mit den Superkombinatoren und der 
dadurch spezif izierten Transformation das Ergebnis 
eindeutig ident if iziert und extrahiert werden kann . 

Eine Realisierung fur die Basisoperation der Substitution 
kann durch Restriktionsenzyme erfolgen wie in [35] 
theoretisch beschrieben (siehe hierzu auch Fig, 2) . 

Die Realisierung fur die Basisoperation der Substitution 
kann auch durch Hybr idisierung (St ickermodell ) wie in [3 5] 
theoretisch beschrieben erfolgen. 

Mit der Erfindung wird also ein Computer vorgeschlagen, 
der frei programmierbar und in der Lage ist # allgemeine 
Berechnungen durchzuf iihren , und sich von herkommi ichen 
elektronischen Rechnern dadurch unterscheide t , 
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da£ die Inf ormat ionsspeicherung durch Biopolymere, 
insbesondere DNS-Molekiile (DNS - Desoxyribo-Nuklein- 



vorgenommen wird, 

daS die Basisoperat ionen durch biologische bzw. 
biotechnologische Techniken auf den kodierenden 
Biopolymeren, insbesondere den DNS - Mole kill en durch- 
gefiihrt werden, und 

dafi die Berechnung durch Kombinat ionsausdriicke einer 
Reduktionssprache, wie z. B. dem X-Kalkiil organisiert 
wird . 

Letzteres hat den Vorteil, daS im wesentlichen nur eine 
einzige Operation, die Substitution von freien Variablen 
durch Ausdriicke, realisiert -werden mu£, um ein 
universelles Berechnungssystem zu implement ieren . AuSerdem 
garantiert eine inharente Eigenschaft des X-Kalkiils, die 
sog. Church-Rosser-Eigenschaf t , daS das Endergebnis von 
Berechnungen, unabhangig von der konkreten Reihenfolge der 
Basisoperationen eindeutig ist. Das unterscheidet 
X-Kalkiil-basierte ( f unkt ionale) Systeme wesentlich von 
alien herkommlichen Rechnern, die auf dem Prinzip der 
Turingmas chine ( Zustands trans f ormat ion) auf gebaut sind, 
und erlaubt erst die effiziente Nutzung des in der DNS - 
Technologie liegenden Vorteils der unabhangigen Ausfiihrung 
von Berechnungen auf 10 17 oder mehr Molekiilen innerhalb 
eines Rechenapparates . Bei herkommlichen Rechnern entsteht 
das bereits von Parallelrechnern mit nur wenigen (hundert) 
Prozessoren bekannte Problem, die Berechnung so zu 
kontrollieren und zu programmieren, da£ unerwiinschte 
Seitenef f ekte nicht zu indet erminist ischen Ergebnissen 
fiihren. Fur viele kooper ierende Prozesse in herkommlichen 
Systemen ist das entstehende organisator ische Problem sehr 
schwierig, mit groSem Programmierauf wand verbunden, 
notorisch unsicher, und durch die notwendigen 
Synchronisat ionen der einzelnen Berechnungen auch 



Saure , 



auch 



DNA 



= Desoxyribo-Nucl ein -Acid) 
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inef f izient . Fur GroSenordnungen, wie sie bei molekularen 
Systemen entstehen, sind die Probleme praktisch unlosbar. 
Durch das hier vorgeschlagene System werden diese Probleme 
vermieden und DNS-Operationen effizient fur praktische 
5 Berechnungen nutzbar. 

Die Nutzung von DNS-Molekulen ist kurzlich zur Losung 
kombinatorischer, einschlieSlich sog. NP-schwerer Probleme 
vorgeschlagen worden (DNA computing [1,3,20] und 

10 WO-A- 97/07440 ) . Die enorme Anzahl von Molekulen wird dabei 

dazu eingesetzt, simultan alle Kodierungen moglicher 
Losungen mittels einiger weniger biotechnologischer 
Operationen durchzuprobieren . Der Ansatz hat das 
Potential, die Grenzen konventioneller Computer in dieser 

15 Hinsicht urn mehrere GroSenordnungen hinauszuschieben . 

Andererseits ist dieser Ansatz zu einfach, urn allgemeine, 
beliebige Rechnungen auszufiihren und zudem wird das 
Potential der grofien Zahl von DNS-Molekulen in relativ 
kleinen Volumina durch das exponent ielle Anwachsen der 

20 benotigten Operationen bei einem solchen einfachen 

Durchprobierungs (Enumerations) -Verfahren schnell 
auf gezehrt . 

Demgegenuber wird ein universelles , frei programmierbares 
25 System vorgeschlagen, das nicht nur diese Nachteile 

vermeidet und ein konzises Konzept zur Nutzung massiver 
Nebenlauf igkeit ( Parallelitat ) , zur effizienten Arbeits- 
lastverteilung auf viele Prozessoren ohne unnotige 
Synchronisation und Kommunikat ion einschlieSt, sondern 
30 auch einfach mit DNS realisiert werden kann . Es ist sogar 

so, da£ die oben erwahnte Basisoperat ion des X-Kalkuls, 
d. h. eine Transformation eines durch eine Zeichensequenz 
kodierten Ausdrucks des X-Kalkul in einen anderen eben- 
falls durch eine Zeichensequenz kodierten Ausdruck, sich 
35 geradezu fur eine Implement ierung durch Zeichenketten, wie 
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sie in DNS-Molekiilen zur Speicherung und Verarbeitung in 
alien biologischen Organismen verwendet werden, anbietet . 

Das verkehrt die bisherigen Nachteile funktionaler 
Systeme, die auf herkommlichen elektronischen Systemen 
emuliert werden muSten, ins Gegenteil, da die zustands- 
transf ormierenden Systeme praktisch unlosbare Probleme mit 
der massiven Parallelverarbeitung implizieren. 

Nachfolgend wird anhand der Zeichnung ein Ausfiihrungs- 
beispiel der Erfindung naher erlautert. Im einzelnen 
zeigen : 

Fig. 1 eine schematische Darstellung als Blockschalt— 
bild eines funktionalen DNS-Rechners, und 

Fig. 2 eine graphische Darstellung der im DNA-Subsystem 
des DNS-Rechners verwendeten Basisoperationen 
(molekularbiologische Techniken) . 



Systemkonzept 

Bei dem Ausf iihrungsbeispiel wird die DNS-Technologie fur 
universelle Berechnungen auf der Basis des A-Kalkuls 

5 eingesetzt. Damit werden die Starken der DNS-Technologie, 

namlich ein hoher Grad an Parailelitat ohne 
Kommunikationsbedarf , voll ausgenutzt. AuSerdem kann das 
funktionale Berechnungsmodell zum ersten Mai durch eine 
dem Modell entsprechende implementierung realisiert und 

0 mit angemessenen Prozessorzahlen versehen werden. Bei der 

Erfindung handelt es sich also um ein hybrides System aus 
vorgeschalteter Elektronik und DNS-Technologie stehen, das 
einen universellen funktionalen Rechner darstellt. 
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Es exist ieren langjahrige Erfahrungen sowohl im Bereich 
der konzeptuellen Grundlagen des A-Kalkuls und der 
Redukt ionssysteme als auch in Beziehung auf die 
Implementierung solcher Systeme mittels spezieller Hard- 
5 ware - sog. Redukt ionsmaschinen - [6,7,16] und als 

Emulator/Simulator auf konventionellen Rechnern 
[17,34,35]. Aufierdem steht ein Programmiersystem zur 
Programmspezif ikation mittels mathemat ischer Funk t ions - 
gleichungen [22,23,24,32,33,35] zur Verfiigung. Da die 
10 Programmausf uhrung auf der bedeutungserhaltenden Trans- 

formation von Ausdrucken beruht, kann jeder Zwischen- 
schritt von Berechnungen wieder vollstandig in einen 
Ausdruck der Programmiersprache zuruckiibersetzt und damit 
vom Benutzer analysiert werden. 

15 

Die effiziente Ausfuhrung solcher Programme auf herkomm- 
lichen Parallelrechnern kann mittels einer vollstandig 
systemgesteuerten Arbeitslastverteilung [34, 35] durch- 
gefuhrt werden. Dabei unterscheiden sich "parallels " nicht 
20 von "sequentiellen" Programmen; das Problem der 

" Parallelisierung" und der zugehorige Korrektheitsnachweis 
entfallt daher fur den Programmierer . 



25 Der Aufbau eines DNS-Rechners 

Der DNS-Rechner ist wie in Fig. 1 auf gebaut . Ein Vor- oder 
Host-Rechner (links) konvent lonelier Technologie 
spezifiziert und organisiert die funktionale Berechnung. 
Er fiihrt ggf . Analysen hinsichtlich der benotigten 

3 0 Ressourcen an DNS-Volumen und Zeit durch. Die DNS- 

Komponente (rechts) besteht aus einer Apparatur, die DNS- 
Segmente nach Vorgabe synthet isiert , einem Reakticns- 
apparat und einer Apparatur, die das Reakt ionsergebnis 
analysiert (ausliest) . Letztere Apparatur hat eine 

3 5 Verbindung zuruck zum Host-Rechner. 
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Fur den DNS-Rechner sind insbesondere die folgenden Dinge 
von Vorteil : 

Das f unkt ionale Programm kann in einer hohen 
f unkt ionalen Programmier sprache [31,25,27] 
5 spezifiziert werden. Das vorhandene Entwicklungs- 

system kann als Programmiersystem und Schnitt stelle 
zum DNS-Rechnersystem eingesetzt werden. Dabei konnen 
Programme entwickelt, durch schrittweise Ausfuhrung 
getestet und interaktiv an kleinen Probleminstanzen 

10 validiert werden [22,23,27,35], urn sie schlieSlich 

fur aufwendige Produkt ionslauf e an das DNS -Subsystem 
zu ubergeben. Die Schnittstellen des Host-Systems zu 
Standard-Betriebssystemen ermoglichen die Nutzung der 
DNS-Komponente als "Computer Server" fur herkommiiche 

15 Programmsysteme . 

Der Vorrechner kompiliert zunachst das f unkt ionale 
Programm. Transliteration bedeutet hier die 
Berechnung der geeigneten Kodierungen von Programm- 
teilen in DNS-Strings und die Generierung der 

20 Anweisung fur die DNS-Synthese-Apparatur . Die DNS - 

Synthese-Apparatur erzeugt die Strings nach den 
Vorgaben des Host -Rechners . 

Dann wird dafiir gesorgt (automatisch oder von Hand) , 
da£ die DNS miteinander reagiert . Die Randbedingungen 
25 fur die Reaktion (Zeit, Temperatur etc.) konnten auch 

vom Host-Rechner berechnet werden. 

Nach der Reaktion wird das Ergebnis analysiert und 
die DNS-Strings, die die Ausgabe kodieren, werden 
selektiert . Auch hier konnen als Teil der Kompilation 
30 im Host-Rechner Steuerungsinf ormat ionen generiert 

werden . 

Schlietelich wird die Ausgabeinf ormat ion an den 
Vorrechner zuriickgegeben und dekodiert {De-Trans- 
li tera tion) . 



it? 
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Wie diesem Bild einer DNS-Rechnung entnommen werden kann, 
sind inf ormatische und molekularbiologische Aspekte stark 
miteinander verzahnt . Auf der Inf ormat ikseite sind DNS - 
Kodierungen fur funktionale Programme erforderlich und der 
5 Kompilation anzupassen [35] . Ferner sollten Modelle 

entwickelt werden, die die molekularbiologischen 
Reaktionen in der DNS zu analysieren gestatten, weil die 
Cute von DNS -Kodierungen nur auf der Basis von Wissen 
dariiber geschatzt werden kann, was in der DNS-L6sung 
10 tatsachlich passiert . 

Auf der molekularbiologischen Seite ist eine neue Art von 
Labortechnik basierend auf DNS-Replikation (PCR) und 
Selektion zu entwickeln. Ansatze hierfiir gibt es bereits 

15 in den Konzepten von DNA computing, wie es bis heute 

untersucht wird. Fur ein (schon universelles ) Basis- 
reduktionssystem ist nur eine einzige Operation notwendig: 
die Anwendung von Funktions- auf Argumentationsausdrucke . 
In Stringreduktionssystemen wird diese Basisoperat ion 

2 0 durch die sog. /3-Reduktion realisiert. Dabei wird der 

Argumentausdruck einer Applikation fur alle freien 
Vorkommen einer Variablen im Rumpf der Abstraktion 
(Funktion) eingesetzt . Der Argumentausdruck muS 
entsprechend oft repliziert werden. 



25 



Die Syntax des A-Kalkiil ist durch folgende Grammatik 
def iniert : 



30 E -» v Variable 

| c Konstante 

| Xv.E Funktionsdef inition 

j @EE Funktionsanwendung 



35 
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Fur die vollstandige Beschreibung und praktische Durch- 
fiihrung von Berechnungen in einem funktionalen Basissystem 
ist nur eine Basisoperat ion , die Substitution F [xr <= a] 
des Ausdrucks A fur freie Vorkommen der Variablen v im 
Funkt ionsausdruck F notwendig [3 5] . 

Formal ist die Semantik (Bedeutung) , d. h. auch die 
Berechnungen oder Reduktionen, von A-Ausdriicken E durch 
die folgende Funktion m(E) spezif iziert : 



wenn E = c I v \ Xv.F unverandert 



m(E) 



F /V A] wenn E = @ Xv.F A Funktions- 
15 anwendung 



Eine Realisierung dieser Basisoperat ion mittels DNS ■ 
Operationen ist graphisch in Fig. 2 dargestellt: 



Die gesamte Programmausf lihrung eines applikativen 
Programms ist nun eine (beliebige) Folge solcher 
(3 -Reduktionen bis auf eine Normalform erreicht ist. Eine 
Normalform eines Programmausdrucks (kodiert als DNS - 

25 String) ist ein bedeutungsaquivalenter Ausdruck (ebenfalls 

ein DNS-String) , der keine anwendbare Reduktion mehr 
enthalt . Man kann sagen, date eine funktionaie Programm- 
spezif ikation zu seiner Bedeutung (dem Programmergebnis ) 
reduziert wird. Dieses Programmergebnis mu£ identif iziert , 

30 zur Riickgabe an den Host selektiert und zuruckiiberset zt 

werden. Die Mechanismen fur die eindeutige Riickuberset zung 
(Transliterierung) [24,3 5] von Redukt ionssprachen- 
ausdrucken in abstrakten Maschinencode fur herkdmmi iche 
Rechenarchitekturen sind in den vorgenannten Redukt ions - 

35 maschinenpro j ekten entwickelt und erprobt worden. 
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Fur eine DNS -Realisierung muB eine gezielte Duplizierung 
des Arguments, das Auffinden von Variablen im Funktions- 
rumpf durch Matching und das geordnete Ersetzen der 
Variablen durch den Argumentausdruck implement iert werden. 

Bisherigen Konzepten von DMA computing liegt das SIMD- 
Modell zugrunde. Das heiSt, da£ die Operationen 
synchronisiert ablaufen. Jede Reaktion dauert dabei etwa 
eine Stunde . Funktionale Programme erlauben aufgrund der 
Church-Rosser-Eigenschaf t [2 , 17 , 15 , 35] den asynchronen 
Ablauf sich gegenseitig nicht storender Operationen. Das 
bedeutet, date bei geeigneter Kodierung keine explizite 
Synchronisation stattfinden muS. Das wurde die notwendige 
Berechnungszeit erheblich herabsetzen, z. B. auf eine 
Stunde fur eine ganze Rechnung anstatt auf eine Stunde pro 
Rechenschritt . Da£ sich die einzelnen Berechnungsschritte 
nicht storen, ware wieder durch eine geeignete Kodierung 
zu sichern. 

Das vorgeschlagene Konzept fur eine neue Basis von 
Berechnungen und das neue hybride Rechnersystem stellt zum 
ersten Mai eine dem mathematisch eleganten Berechnungs- 
modell angepaEte "Hardwareplattf orm" zur Verfugung, die 
auch in naturlicher Weise die inharente Nebenlauf igkeit 
funktionaler Berechnungen unterstiitzt . Damit wird auch ein 
neues und erf olgversprechendes Konzept fur die Nutzung 
"massiver Parallel it at " vorgeschlagen . 

Die bisher bestehenden Nachteile des DNA computing, die 
vor allem daher ruhren, da£ man vollstandige Enumeration 
auf der Basis des zustandsorient ierten Modells vorschlagt, 
also Berechnungen durchfuhren will, die man nach der 
klassischen Technologie nie umsetzen wurde, fallen hier 
weg. Bei einer funktionalen DNS - Berechnung wird tatsach- 
lich nur das berechnet, was das funktionale Programm auch 
in anderen Implement ierungen ausfiihren wurde. Das sollte 
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die Anf orderungen an das DNS-Volumen erheblich herab- 
setzen. Dariiber hinaus wiirde durch eine asynchrone DNS- 
Berechnung die berechnungszei t , aber auch die Notwendig- 
keit expliziter externer Steuerung der Berechnung 
5 drastisch reduziert. 

Der Inhalt der im Literaturverzeichnis aufgefuhrten 
Literaturstellen sowie der anderweitig zitierten Literatur 
wird hiermit durch Bezugnahme auch zum Inhalt der 
10 Erfindung gemacht . 



1 Weiteres Ausf lihrungsbei spiel 
1 . 1 Vorbemerkung 

15 Nachfolgend wird ein weiteres Ausf iihrungsbeispiel der 

Erfindung beschrieben, wobei die Umsetzung der Reduktions- 
sprache des Vorrechners in DNS-Systemen sowie deren 
Weiterverarbeitung zur Ausfiihrung des Programms naher 
beschrieben sind. 

20 Dieses Ausf iihrungsbeispiel bezieht sich auf eine 

Implement ierung eines universe 11 en Berechnungskonzeptes 
(X-Kalkul) mittels DNA und insbesondere auf die Nutzung 
der spezifischen Eigenschaf ten des \-Kalkuls fur ein 
massiv paralleles asynchron arbeitendes und dezentral 

25 organisiertes Rechensystem durch eine kombinierte 

elektronische/biologische Maschinerie und 
biotechnologische Basisoperationen zur Implementierung der 
massiv parallelen Schritte. Das vorgeschlagene biologische 
Subsystem der Speicherung der Information (Programm und 

30 Daten) als Strings in DNA-Molekiilen und ihre nebenlaufige 

Bearbeitung durch Operationen auf einer Unzahl 
unabhangiger Sequenzen/Molekiile , die in einem Reaktor 
gelost in einer Pufferlosung enthalten sind, verbietet die 
Annahme einer zentralen Kontrollinstanz oder detaill ierten 
35 Steuerung der einzelnen Berechnungsschritte . Im Gegenteil 

mufi ein Berechnungskonzept der Selbstorganisat ion in 
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solchen Anordnungen Rechnung tragen und durch 
entsprechende organisatorische Konzepte die erwunschten 
Berechnungen realisieren . 

Die genaue Ausfuhrung der Komponente ist deshalb fur die 
erf indungsgemaBe Implement ierung des DNA-Rechners von 
untergeordneter Bedeutung und stark abhangig vom weiteren 
Fortschritt der biotechnologischen Verfahren und deren 
Fehlerrate. Der vorgeschlagene Rechner kann direkt an sich 
wandelnde Technologien und neue Verfahren angepatet werden, 
indem die Umsetzung der Programmiersprachenausdrucke in 
DNA- Strings (d. h. konkret die Codegenerierungs - Komponente 
des Compilers) fur die Synthesevorrichtung entsprechend 
angepaSt wird. Das vorgeschlagene Konzept ist also auch in 
der Hinsicht universell, daft neue Basistechnologien 
einfach fur neue Generationen des vorgeschlagenen Hybrid- 
rechners genutzt werden konnen. 



2 0 1.2 Systemkomponenten 

Zur Illustration werden diese Vorteile des vorgeschlagenen 
Hybridrechners an einem konkreten Beispiel ausgefuhrt. 
Dabei werden die beiden wesentlichen Komponenten des 
Systems exemplarisch implementiert : 

25 

1. ein Ausfuhrungsbeispiel fur die Bearbeitung eines 
konkreten Programmausdrucks , der eine schon recht 
komplizierte zweifach rekursive Funktion 

spezif iziert , bestehend aus 
30 < a > de ^ Spezif ikation und Eingabe der Problemiosung 

als funktionales Programm mittels der syntax- 
gesteuerten Benut zerschnit tstelle des herkomm- 
lichen Computers, 
(b) die flexible und anpassungsf ahige Umsetzung des 
35 Programms als String-Sequenz von Nukleotiden 

durch einen entsprechenden Compiler, der auf dem 
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herkommlichen Computer ausgefiihrt wird, als 
Eingabe fur die DNA-Synthesevorrichtung , 
(c) die Synthese and Vervielf al t igung der 
spezif izierten DNA-Molekiile in einer geeigneten 
5 Puf f erlosung zur Durchfuhrung der 

biotechnologischen Basisoperationen, die die 
nebenlauf ige , verteilte Aufteilung der 
Berechnung und die Ausfiihrung der Berechnungen 
realisieren, 

10 (d) die Zusammensetzung der parallel berechneten 

Teilergebnisse zu Gesamtlosungen , 

(e) die Extraktion des DNA-Molekiils , das die Gesamt- 
losung reprasentiert , aus dem Reaktor mit der 
Puf f erlosung, mittels einer geeigneten Anker- 

15 sequenz, 

(f) die Sequenzierung des extrahierten DNA-Molekiils 
und die Riickgabe der entsprechenden Sequenz an 
die elektronische Komponente, und 

(g) die Dekodierung der Sequenz und ihre Umsetzung 
20 (Dekompilat ion) und Visualisierung mit Hilfe der 

Benutzerschnitt stelle . 

2. die Erzeugung und Behandiung massiv paralleler 
Ausf iihrungsstrange im DNA-Subsystem, bestehend aus 
25 (a) der Vorbereitung der nebenlauf ig ausfiihrbaren 

Progr ammt e i 1 e durch e n t s p r e c h e n de 
Identif izierung und Abstraktion der Ausdriicke 
wahrend der Ubersetzung (Compiler) auf dem 
herkommlichen Rechner. Das kann sowohl durch 
30 systemgesteuerte Analyse des spezif izierten 

Programmausdrucks als auch durch explizite 
Benut zerannotat ionen durchgef uhrt werden , 
(b) der Ausfiihrung der entsprechenden Aufteiiungs- 
Funktionen (dis) . Das fiihrt im Bio-Subsystem zur 
35 Aufteilung des jeweiligen Gesamtmolekuls in 

mehrere DNA-Molekule , dem Haupttemplate und zwei 
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(Oder mehr) DNA-Molekulen, die vollig unabhangig 
voneinander in der Pufferlosung bearbeitet 
werden konnen, 

(c) der rekursiven Anwendung des Auf teilungsschemas 
5 nebenlaufig mit den zugehorigen sequent iellen 

Berechnungen. Das fuhrt theoretisch zu einer 
riesigen Zahl unabhangiger Prozesse, die nur 
durch die kausalen Abhangigkeiten der Problem- 
stellung und die in der Pufferlosung zur 

10 Verfiigung gestellten Ressourcen praktisch 

begrenzt ist. Diese Ressourcen konnen in der 
Programmvervielf altigungsphase (PCR-Schritt nach 
der Synthese der Programmsequenz ) abhangig von 
der Anwendung und der Verf iigbarkeit der ubrigen 

15 Materialien spezifisch eingestellt werden, und 

(d) der Synchronisation (X*) der unabhangigen 
Programmteile mit dem zugehorigen Haupttemplate 
durch die vorbereitete /3-Reduktion und der 
dadurch realisierte Zusammenbau der Gesamt- 

2 0 losung. 



1 . 3 Beispiel 

Es werden die zwei genannten Ausf uhrungsbeispiele anhand 
25 des folgenden Programmbeispiels diskutiert, das als 

Standardbenchmark fur funktionale Systeme und zugehorige 
Rechnerarchitekturen gut untersucht ist. 



3 0 



35 



Folgende mathemat ische Zahlenreihe (Fibonacci -Zahlen) , die 
fur die Modellierung diverser Wachstumsprozesse von 
Bedeutung ist, soil durch eine zweifach rekursive Funktion 
berechnet werden : 



1,1,2,3,5,8,13,21,34,55,89, 
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23 



10 



15 



20 



25 



30 



Die Zahlenfolge ergibt sich dadurch, da£ ein Element der 
Folge sich aus der Summe der beiden vorangegangenen Zahlen 
berechnet . Die zugehdrige zweifach rekursive Funktion zur 
Berechnung der Folge in unserer funktionalen Notation ist 
wie f olgt : 

f{n) = if (nsl) then 1 else f ( n~ 1) + f (n- 2 ) 

Dabei ist f(n) die n-te Zahl der Folge. Beginnend mit 1 
fur n=0 oder n=l (then-Teil) ergeben sich die anderen 
Elemente als Summe der beiden vorhergehenden (else-Teil), 
also z, B. die zehnte Fibonacci - Zahl durch f(10) = 89. 

Die Anzahl der notwendigen Operationen zur zweifach 
rekursiven Berechnung dieser Folge wachst exponentiell mit 
n, so daS zur Bestimmung von f(20) = 10.946 schon eine 
groEe (21.891), fur f(50) = 20.365.011.074 eine 
astronomische (40.730.022.147) Zahl von Funktions- 
auf ruf en/Rechenoperationen durchgef uhrt werden muE . 

1.4 Kodierungsbeispiel fur die Berechnung der Fibonacci - 
Funktion 

Die interne Konstruktorsyntaxdarstellung obiger Fibonacci - 
Funktion f ist wie f olgt : 

AP REC VAR f SUB VAR n AP AP <= VAR n INT 1 



AP + AP VAR f AP - VAR n INT 1 



AP VAR f AP - VAR n INT 2 



INT 20 
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Urn die Struktur fur die weiter unten angegebene 
Kompilation etwas besser hervorzuheben , lafit sich das 
Programm Equivalent wie folgt darstellen: 



5 AP rec var f 

SUB VAR n 

AP AP « 

VAR n 
INT 1 

10 IF INT 1 

AP + 

AP VAR f 
AP - 

VAR n 

15 INT 1 

AP VAR f 
AP - 

VAR n 
INT 2 

20 INT 20 



Dabei bindet der zweistellige Konstruktor REC die folgende 
Variable rekursiv, SUB nicht rekursiv im Funk t ions rump f . 
25 Der Applikator AP spezif iziert die Anwendung der genannten 

Funktion auf die folgenden Argument e . Die einstelligen 
Konstruktoren VAR und INT geben den Typ des nachf olgenden 
Konstrukts an. 

3 0 Tabelle 1 listet die DNA-Kodierung der hier verwendeten 

zweistelligen Konstruktoren : 



DNA- 


■Code 


Konstruktor syntax 


AAA. 


AAA 


REC 


<variable> 


<expr> 


AAA 


AAG 


SUB 


<variable> 


<expr> 


AAA 


AGA 


IF 


<expr> 


< expr > 


AAA 


AGG 


AP 


<expr > 


<expr > 


AAA 


GGG 


SUB* 


< var i able > 


<expr> 



Tabelle 1: DNA-Kodierung zweistelliger Konstruktoren 
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Die Codes der hier verwendeten einstelligen Konstruktoren 
sind in Tabelle 2 angegeben: 



DNA-Code 


Kons t ruk t o r syn t ax 


GGG. AAA 
GGG . AAG 
GGG . AGA 


VAR <string> 
INT <number> 
FUNC <func-id> 



Tabelle 2: DNA- Kodierung einstelliger Konstruktoren 

10 



Variablennamen <string> und Funkt ionsident if ikatoren 
<func-id> konnen durchnumeriert und wie Zahlen <number> 
und Zeichen <string> kodiert werden. Dabei werden einzelne 

15 Ziffern des Dualsystems durch drei Nukleotide (als Codon) 

kodiert, '0' als-'CCC und '1' als 'TTT' , natiirlich wurde 
auch ein Nukleotid ausreichen, allerdings wird die 
Redundanz durch die Verwendung von mehr Nukleotiden 
erhoht ; je nach Fehleranf alligkeit der biotechnologischen 

2 0 Operationen kann die Redundanz durch Verwendung langerer 

Kodierungen (erweiterte Codone oder Verwendung von mehr 
Codonen pro Ziffer) oder durch groSeren Harnmigabstand der 
Kodierung noch verbessert oder an spezielle Gegebenheit en 
der eingesetzten biotechnologischen Operationen angepa£t 

25 werden. 



Um eine kompakte Kodierung beliebig vieler Zeichen und 
Zahlen zu erlauben, werden sie durch eine Binardarstellung 
mit einem Anfangs- (CAC) und einem Endmarker (ACA) 
3 0 kodiert. Die Technik der Anfangs- und Endmarker kann auch 

fur die Konstruktoren verwendet werden, um einerseits eine 
kompaktere Kodierung zu erhalten oder andererseits den 
Einbau von Restrikt ionsschnittstellen zur Aufteilung der 
Ausdriicke in ihre Syntaxkomponenten zu ermoglichen. 



BNSDOCID: <WO 9847077A1 _!_> 



WO 98/47077 Jg^ PCT/EP98/02208 



26 



Die folgende Tabelle 3 zeigt die hier verwendeten Codes. 
Der Punkt dient nur der besseren Lesbarkeit (die 
Aufteilung in die Codone) und ist nicht Teil der 
Codierung . 

5 



DNA-Code 


Zeichen 


Zif fer 


Func - Id 


Binar-Code 








CCC 


' A' 


0 


+ 


0 








TTT 


' B ' 


1 




1 






TTT . 


CCC 


' O 


2 




10 






TTT 


TTT 


' D' 


3 


* 


11 




TTT 


CCC 


CCC 


' E ' 


4 


/ 


100 




TTT 


.CCC 


TTT 


' F' 


5 


< 


101 


TTT . CCC 


CCC 


.TTT 


. TTT 


'N' 


19 


dis 


10011 


TTT . CCC 


TTT 


.CCC 


.CCC 


' O' 


20 




10100 



Tabelle 3: DNA-Kodierung von Basis -Konstrukten 



Zur Ident if izierung und Extraktion der Gesamtlosung aus 
dem Puffer fur das nachfolgende Auslesen (Sequenzierung) 
des Ergebnisses wird die folgende Sequenz als Kodierung 
des MAIN-Konstruktors verwendet : 



DNA-Code 


Konstruktorsyntax 


ACGTACGT 


MAIN <expr> 



30 

Man erhalt also aus der Ubersetzung des Ausdrucks in 
Konstruktorsyntax folgende Nukleot id-Sequenz : 
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ACGTACGT 
AAA. AGG 

AAA. AAA GGG . AAA CAC . TTT . CCC . TTT . ACA 
AAA. AAG 

5 GGG. AAA CAC . TTT . CCC . CCC . TTT . TTT . ACA 

AAA. AGG 

AAA. AGG GGG.AGA CAC . TTT . CCC . ACA 

GGG. AAA CAC. TTT. CCC. CCC . TTT .TTT. ACA 
GGG. AAG CAC. TTT. ACA 
10 AAA . AG A GGG. AAG CAC. TTT. ACA 

AAA. AGG 

GGG.AGA CAC. CCC. ACA 
AAA. AGG 

GGG. AAA CAC. TTT. CCC. TTT. ACA 
15 - AAA. AGG 

GGG.AGA CAC. TTT. ACA 

GGG . AAA CAC . TTT . CCC . CCC . TTT . TTT . ACA 
GGG. AAG CAC. TTT. ACA 

AAA. AGG 

2 0 GGG. AAA CAC . TTT . CCC . TTT . ACA 

AAA. AGG 

GGG.AGA CAC. TTT. ACA 

GGG. AAA CAC. TTT. CCC. CCC. TTT. TTT. ACA 
GGG. AAG CAC. TTT. CCC. ACA 
25 GGG. AAG CAC. TTT. CCC. TTT. CCC. CCC. ACA 



d. h., die Synthesevorrichtung wird instruiert, folgendes 
DNA-Molekiil (bestehend aus 398 Nukleot iden) zu 
produzieren : 

30 

ACGTACGTAAAAGGAAAAAAGGGAAACACTTTCCCTTTACAAAAAAGGGGAAACACTTTCCCCCC 
TTTTTTACAAAAAGGAAAAGGGGGAGACACTTTCCCACAGGGAAACACTTTCCCCCCTTTTTTAC 
AGGGAAGCACTTTACAAAAAGAGGGAAGCACTTTACAAAAAGGGGGAGACACCCCACAAAAAGGG 
GGAAACACTTTCCCTTTACAAAAAGGGGGAGACACTTTACAGGGAAACACTTTCCCCCCTTTTTT 
3 5 ACAGGGAAGCACTTTACAAAAAGGGGGAAACACTTTCCCTTTACAAAAAGGGGGAGACACTTTAC 
AGGGAAACACTTTCCCCCCTTTTTTACAGGGAAGCACTTTCCCACAGGGAAGCACTTTCCCTTTC 
CCCCCACA 



Nach Durchf iihrung aller Operationen ist das Ergebnis der 
40 Bio-Transformation des Hauptprogramms MAIN, d. h. der 

Berechnung von f(20), das folgende DNA-Molekiil: 



ACGTACGTGGGAAGCACTTTCCCTTTCCCTTTCCCTTTTTTCCCCCCCCCCCCTTTCCCACA 
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Das Ergebnis kann mittels des MAIN Labels (ACGTACGT) aus 
der Puf ferlosung extrahiert werden, so da£ man als 
Ergebnis der Berechnung eine Zahl (GGG.AAG) in Binar- 
kodierung (10101011000010) erhalt . 

Die Ubersetzung der Binarkodierung ergibt als Ergebnis der 
Gesamtberechnung die Zahl 10946. 



10 1.5 Kodierungsbeispiel fur die verteilte Berechnung der 

Fibonacc i - Funktion 

Zunachst wird das Funkt ionsbeispiel : 



15 fin) = if (nsl) then 1 else f {n- 1) +f (n- 2 ) 



transf ormiert in 



20 



fin) =ap dis X*t, X*t 2 if (nsl) then 1 else t 2 +t 2 [ f (n- 1 ) , f (n- 2 ) ] 



Dabei hat der Compiler zwei unabhangig voneinander 
25 ausfiihrbare Ausdrucke f{n~l) und f (n-2) ident if iziert und 

mittels einer speziellen X - Abstrakt ion (X* oder SUB*) 
abstrahiert und fur die Verteilung markiert . 

Die Ubersetzung ist nun analog zum Beispiel oben, wobei 
30 lediglich weitere Kodierungen fur die Funktion dis und den 

Konstruktor X* notwendig werden, die in Tabelle 1 schon 
eingef iihrt wurden . 

Die Ausfuhrung der Funktion dis fuhrt zur Aufspaltung des 
35 Programmausdrucks in 3 Molekiile*. den X*-Ausdruck (das 
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o. g. Haupttemplate) , und die beiden Fibonacci-Funkt ions- 
berechnungen . Fur das Beispiel ergibt sich: 



ap sub n ap dis A* t\ X m to if (n < I) then I else U + t 2 [f(n - 1), f(n - 2)] 20 



und nach einem Schritt : 



10 



ap dis X*t, X*t 2 if (20sl) then 1 else t 2 + t 3 [ f (20- 1) , f (20-2 ) ] 



15 



Dadurch entstehen im nachsten Schritt drei unabhangige 
Ausdriicke : 

1. X*t 2 X*t 2 if (20sl) then 1 else t 2 +t 2 

2. F(19) 

3. F(18) 



20 



25 



30 



Im weiteren Verlauf der Berechnung entstehen viele weitere 
unabhangig berechenbare DNA-Molekule . Im folgenden Schritt 
in diesem Beispiel sieben Molekule, von denen vier 
(Nr. 3,4,6,7) direkt weiter prozessiert werden konnen . 



i . 

2 . 

3 . 

4 . 

5 . 

6 . 

7 . 



X*t : X*t 2 if (20sl) then 1 else t 2 +t 2 
X + t, X*t 2 if (19*1) then l else t : +t 2 
F(18) 
F(17) 

X*t ; X*t 2 if (I8sl) then 1 else t,+ t 2 

Fill) 

F(16) 



35 



und dann funfzehn Molekule/Ausdrucken , von denen acht 
(Nr. 4,5,7,8,11,12,14,15) ausfuhrbar sind: 
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1. \*t 2 X*t 2 if (20sl) then 1 else t 2 +t 2 

2. X*t, X*t 2 if <19sl) then 1 else t,+ t 2 

3. X*t 2 X*t 2 if <18sl) then 1 else t^+t. 

4. F(17) 
5 5. F(16) 

6. X*t, X*t 2 if (17sl) then 1 else t,+ t 2 

7. F(16) 

8. F(15) 

9. X*t 2 X*t 2 if (I8si) then 1 else t 2 +t a 
10 10. X*tj X*t 2 if (17sl) then 1 else tj+t 2 

11. F(16) 

12. F(15) 

13. X*t 2 X*t 2 if (16fil) then 1 else t 2 +t 2 

14. F(15) 
15 15. F(14) 



und so weiter. Im allgemeinen konnen von den jeweils 
vorhandenen 2K - 1 Molekiilen K (also immer mehr als die 
Halfte) direkt weiterverarbeitet werden. In diesem 

20 Beispiel konnen bis zu 21891 (genau (2*f(20)-l) Funktions- 

aufrufe) unabhangig ausfiihrbare Programmausdrucke 
entstehen. Letztlich sind jedoch alle Unterausdrucke 
berechnet und das Gesamtergebnis wird (wie analog auch 
schon vorher die entsprechenden Teilergebnisse) zusammen- 

25 gesetzt. Im vorletzten Schritt der Berechnung erhalt man 

also drei Ausdriicke, von denen nur noch einer ausfuhrbar 
ist (Nr. 1) und der die beiden anderen zum Gesamtergebnis 
zusammenfaSt : 



30 1. X*tj X*t 2 if (20sl) then 1 else t a +t 2 

2. 6765 

3. 4181 



35 Man erhalt so den Ausdruck: 

if <20sl) then 1 else 6765+4181 
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schlie&lich : 



6765+4181 



und damit das Endergebnis : 



10946 



10 Damit ergibt sich bei diesem Beispiel zur nebenlauf igen 

Berechnung unabhangiger Programmausdrucke das gleiche 
Ergebnis wie in Abschnitt 1.4 bei der strikt sequent iellen 
Ausfuhrung . 

15 

1.6 Bemerkung zur sequent iellen und nebenlauf igen 
Berechnung des Ausf uhrungsbeispiels 

Bei geniigend Ressourcen bei der nebenlauf igen Ausfuhrung 
kann das gleiche Ergebnis mit erheblich weniger Schritten 
2 0 berechnet werden als bei der sequent iellen Ausfuhrung: 

Wahrend fur die vollstandig verteilte Berechnung nur 
20 GroSschritte erforderlich sind, benotigt die 
sequent ielle Ausfuhrung 218 91 Schritte/Funkt ionsauf ruf e 
(also etwa 1000 mal soviele) . 

25 

Da der Berechnungsauf wand - wie oben erwahnt - 
exponentiell ansteigt, wachst auch die Leistungssteigerung 
durch die nebenlaufige Ausfuhrung mit VergroSerung des 
Arguments drastisch an, fur n = 3 0 betragt der Faktor 
30 beispielsweise schon 30 zu 2.7 Millionen (2.692.537). 

Wie in [35] erlautert, wird es bei endlicher Zahl von 
Prozessoren (allgemein von fur Rechnungen zur Verfiigung 
stehender Ressourcen), hier DNA und Puf f ermater ial , 
35 notwendig, die im UbermaB vorliegende probleminharent e 

Nebenlauf igkeit durch geeignete Einschrankung an die 
verfugbaren Ressourcen anzupassen, urn so eine effiziente 
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Nutzung und eine schnelle Ausfuhrung der notwendigen 
Berechnungen zu gewahrleisten . 
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PATENTANSPRUCHE 

1. Frei programmierbares , universelles Parallel -Rechner- 
system zur Durchfiihrung von allgemeinen Berechnungen, 
mit 

einem elektronischen Vorrechner, der die Eingabe 
beliebiger und damit zur Spezif ikat ion 
allgemeiner Berechnungen fahiger Programme 
erlaubt , deren Umsetzung in Ausdriicke einer 
Reduktionssprache realisiert und deren Kodierung 
in eine DNS-Sequenz vornimmt , 

einer Synthesevorrichtung, die die kodierte DNS- 
Sequenz von dem Vorrechner empf angt und die die 
DNS-Sequenz in ein ent sprechendes DNS-Molekiil 
mit einer spezif izierten Nukleot idabf olge 
synthet isiert , 

einer Vervielf alt igungsvorrichtung zum 
Vervielf altigen des synthet isierten DNS -Molekuls 
mittels einer Amplif ikationsreaktion, 
einer Reakt ionsvorrichtung zum gleichzeit igen 
Ausfiihren von Transf ormationen der DNS-Molekule 
mittels molekularbiologischer Techniken gema£ 
den Redukt ionsregeln einer Reduktionssprache, 
wobei das Ergebnismolekul in der Losung 
ident i f i z iert , extrahiert und ggf - 
vervielf altigt wird, und 

einer Sequenziervorrichtung zum Bestimmen der 
Sequenz des Ergebnismolekiils , 

wobei diese Sequenz an den Vorrechner weiter- 
gegeben wird und 

der Vorrechner die Sequenz dekodiert sowie die 
dekodierte Sequenz ausgibt . 

2. Rechnersystem nach Anspruch 1, dadurch gekenn- 
zeichnet, da£ es sich bei der Reduktionssprache urn 
den X-Kalkiil handelt . 
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3. Rechnersystem nach Anspruch 1 oder 2, dadurch gekenn- 
zeichnet, dafi die im Reduktionsapparat umgesetzten 
molekularbiologischen Techniken Basisoperat ionen wie 
Insert-, Delete- und Substitute-Operationen umfassen. 



4. Rechnersystem nach einem der Anspriiche 1 bis 3, 
dadurch gekennzeichnet, dafi die Amplif ikat ions - 
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